package cn.mars4j.nutch.web.parser;

import java.util.List;

import cn.mars4j.nutch.web.bean.Metadata;

/**
 * 基础解析器
 * BaseParser.java
 *
 * @author sqd
 * 2014年5月8日
 */
public interface Parser {
	
	/**
	 * CONTEXT参数_关键字
	 */
	public static final String MKEY = "mkey";
	
	/**
	 * CONTEXT参数_URL
	 */
	public static final String URL = "url";
	
	/**
	 * CONTEXT参数_分类
	 */
	public static final String CLASSIFY = "classify";


	/**
	 * 抽取页面信息
	 * @param mkey 关键词
	 * @throws Exception
	 */
	public List<Metadata> extract() throws Exception;
}